iT邦幫忙

2023 iThome 鐵人賽

DAY 29
0
自我挑戰組

我與熊貓Pandas相處的日子系列 第 29

Day29- 視覺化呈現(4)箱形分析

  • 分享至 

  • xImage
  •  

箱形圖

假設我們有一組資料,記錄了某公司員工的月薪

月薪 | 次數
------- | --------
10000 | 10
15000 | 20
20000 | 30
25000 | 40
30000 | 50

我們可以使用 Pandas 的 boxplot() 方法來繪製箱形圖,呈現這組資料的月薪分布。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# 建立資料
data = {
    "月薪": [10000, 10000, 10000, 15000, 15000, 15000, 15000, 20000, 20000, 20000, 20000, 25000, 25000, 25000, 25000, 30000, 30000, 30000, 30000, 30000, 30000],
}
df = pd.DataFrame(data)
# 繪製箱形圖
df.boxplot(column="月薪", figsize=(10, 10))
# 顯示圖表
plt.show()

圖表中,我們可以看到月薪的分布情況如下:

  • 中位數月薪為 20000 元
  • 月薪的 25% 的員工月薪低於 15000 元
  • 月薪的 75% 的員工月薪高於 20000 元
  • 有 5% 的員工月薪高於 30000 元

我們可以進一步調整箱形圖的樣式,例如:

  • 更改箱形圖的顏色
  • 添加圖例
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# 建立資料
data = {
    "月薪": [10000, 10000, 10000, 15000, 15000, 15000, 15000, 20000, 20000, 20000, 20000, 25000, 25000, 25000, 25000, 30000, 30000, 30000, 30000, 30000, 30000],
}
df = pd.DataFrame(data)
# 繪製箱形圖
df.boxplot(
    column="月薪",
    figsize=(10, 10),
    color="#ff0000",
    showmeans=True,
    meanprops={"markerfacecolor": "red", "markersize": 10},
)
# 添加圖例
plt.legend(["月薪"], loc="upper right")
# 顯示圖表
plt.show()

圖表中,箱形圖的顏色已更改為紅色,並添加了圖例。

/images/emoticon/emoticon76.gif


上一篇
Day28- 視覺化呈現(3)圓餅分析
下一篇
Day30- 視覺化呈現(5)熱力分析
系列文
我與熊貓Pandas相處的日子30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言